1
经典机器学习
香港理工大学 COMP5511第6讲
00:00

经典机器学习

欢迎来到《人工智能导论》(COMP5511)第6讲。本节课将理论基础与实际算法实现相连接。尽管现代人工智能常强调深度学习,但经典机器学习仍是数据分析的基石。这些算法具有高度的可解释性计算效率,因此成为处理结构化数据和行业标准分析的首选方案。

1. 监督学习

该范式通过在带标签的数据集上训练模型,使算法学习输入特征与特定目标输出之间的关系。这使得模型能够准确地预测结果对新的、未见过的数据进行准确预测。

  • 决策树:将数据划分为分支以得出分类或数值判断的模型。
  • 支持向量机(SVM):寻找最优超平面以最大化不同数据类别之间的间隔。

2. 无监督学习

这些算法分析无标签数据以发现隐藏的模式、结构或分组,而无需事先知道输出应为何种形式。主要技术包括:

  • K均值聚类:基于特征相似性将数据点分入K个不同的组。
  • 主成分分析(PCA):一种降维技术,用于在保留数据核心方差的同时简化复杂数据。
可解释性与复杂性的权衡
经典机器学习的一个显著优势是其透明性。与“黑箱”式的深度学习模型不同,像决策树这样的算法允许人类追溯预测背后的精确逻辑,这对医疗或金融等高风险领域至关重要。
Scikit-learn 实现流程